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UWAGI TERMINOLOGICZNE 


Prognozowaniem nazywamy oparte o naukowe podstawy przewidywanie prze- 
biegu i stanu możliwych (prawdopodobnych) przyszłych zdarzeń. Konkretny wynik 
procesu przewidywania określamy mianem prognozy. W wielu ośrodkach badaw- 
czych na całym świecie konstruuje się obecnie szereg różnego rodzaju prognoz. W li- 
teraturze polskiej najczęściej można spotkać się z następującą klasyfikacją prognoz:! 


Kryterium podziału 
horyzont czasowy 


charakter lub struktura 


stopień szczegółowości 


zasięg terenowy 


metoda opracowania 


cel lub funkcja 


Rodzaje prognoz 
prognozy krótko-, średnio- i długoterminowe, perspek- 
tywiczne i ponadperspektywiczne, operacyjne i stra- 
tegiczne (rozpoznawcze), 
prognozy proste i złożone, prognozy zjawisk typu 
ilościowego i jakościowego, 
prognozy ogółne i szczegółowe, prognozy całościowe 
(globalne lub kompleksowe) i częściowe (fragmenta- 
ryczne lub odcinkowe), makro- i mikroekonomiczne, 
prognozy światowe, międzynarodowe, krajowe i regio- 
nalne, : 
prognozy indukcyjne i dedukcyjne, minimalne, 
średnie i maksymalne, czyste (pierwotne) i weryfiko- 
wane, modelowe, 
prognozy ostrzegawcze, badawcze i normatywne, pa- 
sywne i aktywne. 


1 K. Secomski: Prognostyka. Wiedza Powszechna, Warszawa 1971, s.51. 
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Wydaje się, że najważniejszym kryterium klasyfikacji prognoz jest horyzont cza- 
sowy, tj. zbiór tych wszystkich przyszłych okresów, dla których budowane są pro- 
gnozy. Prognozami krótkookresowymi nazywamy takie, które zostały sporządzone 
na okres nie przekraczający roku. Prognozy średniookresowe dotyczą okresu od 
2 do 5 lat, a dlugookresowe — obejmują ponad 5 lat. Dodać przy tym należy, 
że podział ten ma orientacyjny charakter. Klasyfikacja prognoz z punktu widze- 
nia horyzontu czasowego jest bowiem uzależniona od dziedziny prognozowania 
(obiektów prognozy), np. A. Filasiewicz dzieli prognozy według kryterium czaso- 
wego w następujący sposób:? 


Rodzaje prognoz Długoterminowe  Średnioterminowe Krótkoterminowe 


gospodarcze 10-13 lat 2-10 lat poniżej 2 lat 
rozwoju techniki 7-15 lat 3-7 lat 1-3 lat 
meteorologiczne 10-100 dni 3-10 dni 1-2 dni 
morskie 10 dni 1-10 dni 1-24 godzin 
ławin 2-5 dni 15-48 godzin 2-15 godzin 


W miarę wydłużania horyzontu czasowego prognozy, jej trafność (pewność) 
ulega zmniejszeniu. W otaczającej nas rzeczywistości obserwujemy bowiem ciągłe 
zmiany; jedne zjawiska są dość stabilne, inne zaś — zmieniają się w szybkim tem- 
pie. W tej sytuacji pewniejsza jest prognoza zbudowana na najbliższe okresy, gdyż 
błąd prognozy, tj. różnica między prognozą a faktyczną wartością, jaką przyjmie 
zmienna prognozowana w okresie prognozowanym, będzie z pewnością znacznie 
mniejszy niż w przypadku odleglejszego okresu prognozowanego (horyzontu pro- 
gnozy). Zwiększenie pewności prognoz można — oprócz skracania horyzontu cza- 
sowego — osiągnąć poprzez: 

1) zastosowanie kilku metod prognozowania i porównanie ich wyników, 

2) porównanie otrzymanej prognozy z innymi podanymi wcześniej w literaturze 
przedmiotu, a odnoszącymi się do tego samego problemu, 

3) potwierdzenie otrzymanych wyników poprzez logiczne lub matematyczne 
wyprowadzenie wniosków ze znanych już prognoz, 

4) przeprowadzenie weryfikacji merytorycznej. 

Przy budowie prognoz wykorzystywane są różne metody. Można je podzielić 
na dwie grupy: statystyczno-matematyczne i niematematyczne. Metody staty- 
styczno-matematyczne bazują na modelach ekonometrycznych (jednorównaniowych 
bądź wielorównaniowych). Mode! ekonometryczny — to równanie (lub układ 
równań), które w sposób przybliżony przedstawia zasadnicze powiązania ilościowe 
występujące między rozpatrywanymi zjawiskami. Proces wnioskowania w przyszłość 
na podstawie modelu ekonometrycznego określany jest mianem predykcji ekono- 
metrycznej. Przykładem modeli ekonometrycznych jednorównaniowych mogą być 
funkcje regresji, czy też klasyczne modele trendu. Z niematematycznych metod pro- 
gnozowania można wymienić metody ankietowe, intuicyjne, metodę ekspertyz, ko- 


2 A. Filasiewicz: Prognoza, program, plan. Wiedza Powszechna, Warszawa 1971, s.57. 
3 A. Zeliaś: Teoria prognozy, PWE, Warszawa 1984, s. 21. 
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lejnych przybliżeń, delficką, metody analogowe, modelowe, metodę refleksji. W dal- 
szej części tego artykułu zajmiemy się jedynie metodami prognozowania opartymi 
o funkcje regresji i trendu (tendencji rozwojowej). Funkcje te służą do konstrukcji 
prognoz ilościowych, tj. takich, w których chodzi o liczbową ocenę wartości zmien- 
nej prognozowanej w okresie prognozowanym. Prognozy ilościowe można podzielić 
na punktowe i przedzialowe. Prognoza iłościowa punktowa dana jest za pomocą 
jednej liczby, stanowiącej możliwie dobre przybliżenie przyszłej realizacji zmiennej 
prognozowanej. Predykcja przedziałowa polega na wyznaczeniu przedziału liczbo- 
wego, o którym z określonym prawdopodobieństwem można twierdzić, że będzie 
zawierać przyszłą realizację zmiennej prognozowanej, czyli: 


PlyrpEl,)=l-a (1) 


gdzie yrp oznacza wartość prognozy dla zmiennej prognozowanej )q okresie 
prognozowanym T, Ip jest przedziałem liczbowym, natomiast l — a jest z góry 
obranym, bliskim jedności prawdopodobieństwem. Za I — a najczęściej przyjmuje 
się prawdopodobieństwa 0,90 i 0,95. W literaturze przedmiotu prawdopodobieństwo 
1 — a określane jest mianem wiarygodności prognozy. 

Z uwagi na zakładane z góry duże prawdopodobieństwo l — a spełnienia się 
prognozy, predykcja przedziałowa jest bardziej przydatna w praktyce niż punktowa. 
Dla zbudowania prognoz przedziałowych konieczna jest jednak znajomość typu 
rozkładu składnika losowego modelu wykorzystywanego dla celów predykcji (model 
ten określamy mianem predyktora). 

Na podkreślenie zasługuje fakt, że nie każdy model ekonometryczny może sta- 
nowić podstawę do budowy prognoz. Dla celów prognozowania mogą być wykorzy- 
stywane tylko takie modele, które spełniają tzw. podstawowe założenia ekonome- 
trycznego wnioskowania w przyszłość, którymi są:* 

1) znajomość postaci analitycznej, ocen parametrów strukturalnych i para- 
metrów struktury stochastycznej modelu opisującego kształtowanie się zmiennej 
prognozowanej, 

2) stabilność czasowa struktury opisywanych przez dany model zjawisk. Założe- 
nie to dotyczy nie tylko przedziału czasowego, z którego pochodziły dane dotyczące 
przeszłości (tzw. przedziału czasowego próby), ale również okresu prognozowanego. 
Dopuszczalne są tylko powolne i regularne zmiany struktury, 

3) stabilność rozkładu składnika losowego w przedziale czasowym próby i w 
okresie prognozowanym, 

4) znajomość wartości zmiennych objaśniających modelu w okresie prognozowa- 
nym. Przewidywane wartości zmiennych objaśniających dla okresu prognozowanego 
można ustalić następująco: 

a) jeżeli zmienne objaśniające są wskaźnikami będącymi przedmiotem planowa- 
nia gospodarczego (np. wielkość dochodu narodowego, płaca realna, wielkość inwe- 


4 Szersze informacje dotyczące tych metod można znaleźć m.in. w pracach: A. Zeliaś: 
Teoria..., op. cit.; Praktyczne metody predykcji, SGPiS, Warszawa 1975 oraz w pracy zbiorowej 
pod red. M. Cieślak: Nieklasyczne metody prognozowanie, PWN, Warszawa 1983. 

5 Z. Pawłowski: Elementy ekonometrii, PWN, Warszawa 1981, s. 283-284. 
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stycji), to wartości zmiennych objaśniających występujących w modelu w okresie 
prognozowanym ustalane są na poziomie założonym w planie, 

b) poprzez wykorzystanie istniejących już prognoz tych zmiennych, 

c) w drodze wyznaczenia trendów tych zmiennych, a następnie ich ekstrapolację, 

d) poprzez budowę dla każdej zmiennej objaśniającej nowego modelu i wyzna- 
czenie prognoz w oparciu o te modele, 

5) dopuszczalność ekstrapolacji modelu poza zaobserwowany w próbie obszar 
zmienności zmiennych objaśniających. W przypadku, gdy zmienne objaśniające w 
okresie prognozowanym będą charakteryzować się istotnymi zmianami dynamiki 
znacznie odbiegającymi od przedziału czasowego próby, to ekstrapolacja modelu 
poza zaobserwowany w próbie obszar zmienności zmiennych objaśniających będzie 
nieuzasadniona. Dodać przy tym trzeba, że założenie dopuszczalności ekstrapolacji 
modelu — w przeciwieństwie do pozostałych — jest trudne do empirycznej weryfi- 
kacji. 

W procesie wnioskowania w przyszłość mogą być wykorzystywane różne zasady, 
tj. reguły postępowania na podstawie których budowane są prognozy. W przypadku 
predykcji ilościowej najczęściej bierze się pod uwagę dwie zasady, a mianowicie: 
zasadę predykcji nieobciążonej oraz zasadę predykcji według największego praw- 
dopodobieństwa. Zasada predykcji nieobciążonej polega na ustaleniu prognozy na 
poziomie wartości oczekiwanej zmiennej prognozowanej w okresie prognozowanym 
T, tzn.: ` 


Yrp = E(Yr) | (2) 


gdzie Yr jest zmienną prognozowaną w okresie prognozowanym, Yrp jest wartością 
prognozy dla okresu T, natomiast symbol E jest operatorem wartości oczekiwanej 
(nadziei matematycznej). 

Jeżeli proces wnioskowania w przyszłość jest wielokrotnie powtarzany (np. 
systematycznie sporządzane prognozy popytu konsumpcyjnego), to prognozując 
zgodnie z zasadą predykcji nieobciążonej otrzymujemy — średnio — ani nie 
zawyżone, ani nie zaniżone oceny przyszłych realizacji zmiennej prognozowanej. 
Wynika to z tego, że w dostatecznie długim ciągu prognoz popełnione błędy 
dodatnie równoważą się z ujemnymi. 

W przypadku, gdy wnioskowanie w przyszłość ma charakter jednorazowy lub 
jest powtarzane w długich odstępach czasu należy postępować w taki sposób, aby 
zapewnić maksimum szans realizacji tej jednej prognozy. W takich sytuacjach znaj- 
duje zastosowanie zasada predykcji według największego prawdopodobieństwa. Po- 
lega ona na ustaleniu prognozy na poziomie najbardziej prawdopodobnej wartości 
zmiennej prognozowanej, czyli na poziomie dominanty: 


> Yrp = mr(y) (3) 


gdzie mqr(y) oznacza dominantę rozkładu zmiennej prognozowanej Yr w okresie 
T. Tak więc, jeśli zmienna prognozowana ma charakter skokowy, za prognozę tej 
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zmiennej przyjmuje się wówczas tę jej wartość, której odpowiada największe praw- 
dopodobieństwo realizacji w okresie T. Natomiast w przypadku zmiennej ciągłej, 
za prognozę przyjmujemy tę wartość zmiennej prognozowanej, której odpowiada 
maksimum funkcji gęstości prawdopodobieństwa rozkładu tej zmiennej. 

Podstawowe założenia teorii predykcji ekonometrycznej uzupełniane są zazwy- 
czaj dwoma dodatkowymi postulatami. Pierwszy z nich głosi, że efektem pre- 
dykcji powinna być nie tylko odpowiednia prognoza, lecz także ocena rzędu jej 
dokładności. Drugi postulat wskazuje, że gdy możliwa jest konstrukcja prognozy 
kilkoma sposobami, to należy wybrać ten, którego miernik rzędu dokładności pre- 
dykcji jest najlepszy. 

Ocena dokładności skonstruowanych prognoz może być przeprowadzona w dwo- 
jaki sposób: 1) przez podanie oczekiwanej wartości odchyleń rzeczywistych realiza- 
cji zmiennej prognozowanej od prognozy (błąd średni predykcji), 2) przez oblicze- 
nie średniego błędu prognozy. Pierwszy sposób jest miernikiem dokładności ez ante, 
drugi zaś — miernikiem dokladności er post. Przy predykcji przedziałowej mierni- 
kami rzędu dokładności wnioskowania w przyszłość są: 1) z góry przyjęte prawdo- 
podobieństwo 1 — a, 2) długość przedziału predykcji I„. Przy ustalonej długości 
przedziału sytuacja jest tym korzystniejsza, im wyższe (bliższe jedności) jest praw- 
dopodobieństwo 1— a. Natomiast przy ustalonym prawdopodobieństwie I — a wnio- 
skowanie jest tym korzystniejsze, im krótszy jest przedział predykcji Ip. 

Błąd średni predykcji (miernik dokładności predykcji ez ante) definiujemy 
następująco: 


Vr = VE(Yr - yrr} (4) 
Różnica między zmienną prognozowaną w okresie prognozowanym a wartością 
prognozy nazywana jest błędem predykcji. Przy stosowaniu zasady predykcji 
nieobciążonej spełniona jest równość (2). Stąd też błąd średni predykcji jest miarą 
rzędu odchyleń zmiennej prognozowanej od postawionej prognozy w długim ciągu 
okresów prognozowanych charakteryzujących się tymi samymi wartościami zmien- 
nych objaśniających. W praktyce wygodniej jest posługiwać się względnym średnim 
błędem predykcji obliczanym według wzoru:. 


qr = M. 100% (5) 
YTP 


Względny średni błąd predykcji informuje o tym, jaką procentowo część prognozy 
stanowi średni błąd predykcji. Prognoza jest tym lepsza, im mniejsze są wartości 
Vr. Korzystając z tego formułuje się często kryterium dopuszczalności prognozy w 
postaci nierówności: | 


Wr<y dla 7>0 (6) 


gdzie y jest daną z góry liczbą (zwykle wyrażoną w procentach), zależną od 
konkretnej sytuacji oraz praktycznych potrzeb w zakresie wymaganej dokładności 
formułowanych prognoz. Oznacza to, że wielkości y mogą kształtować się różnie 
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dla różnych zmiennych prognozowanych i odmiennych warunków dokonywania 
predykcji. Prognozy spełniające relację (6) nazywamy prognozami dopuszczalnymi. 
W przypadku prognoz przedzialowych kryterium dopuszczalności formułuje się 
jako: 


PilYr —yrp|<e)>l-a (7) 


gdzie e > 0 oraz 0 < 1— a < l są z góry obranymi liczbami. W zastosowaniach 
praktycznych liczbę e ustala się na stosunkowo niskim poziomie, natomiast prawdo- 
podobieństwo I — a na możliwie wysokim poziomie. Konkretny dobór tych wielkości 
zależy od określonych warunków, decydujących o praktycznej przydatności prognoz. 

Średni błąd prognozy (miernik dokladności ez post) jest pierwiastkiem kwadra- 
towym z wariancji błędu prognozy, tzn.: 


1 n+m 
Sp = m s Yr- vee} (T=n+ 1,...,n+ m) (8) 


gdzie yr oznacza rzeczywiste realizacje zmiennej Y w okresie prognozowanym 
T, yrp — wartości prognozy dla zmiennej Y w okresie T, natomiast m jest liczbą 
naturalną określającą odległość okresu prognozowanego od okresu bieżącego. 

Średni błąd prognozy informuje, o ile — średnio rzecz biorąc — rzeczywiste re- 
alizacje zmiennej prognozowanej różnią się od wyznaczonych prognoz. Oczywistym 
jest, że miernik (8) można obliczyć dopiero po zrealizowaniu się m prognoz wskutek 
upływu czasu (prognozy takie określamy mianem prognoz wygasłych). 


PROGNOZOWANIE NA PODSTAWIE FUNKCJI REGRESJI 


Metoda prognozowania wykorzystująca funkcje regresji wymaga uprzedniego 
rozwiązania szeregu problemów, a mianowicie: wyboru analitycznej postaci funkcji, 
doboru najlepszego zbioru zmiennych objaśniających, wyboru metody estymacji 
parametrów, wyznaczenia wartości zmiennych objaśniających w okresie prognozo- 
wanym, wreszcie — wyboru odpowiedniej metody predykcji. Podstawą predyk- 
cji może być tylko taka funkcja regresji, która charakteryzuje się własnościami 
predyktywnymi, tzn. dobrym dopasowaniem do danych empirycznych. Na dobre 
dopasowanie funkcji do danych empirycznych wskazują niskie średnie błędy sza- 
cunku parametrów strukturalnych, mała wariancja składników resztowych oraz nie- 
wielka wartość współczynnika zbieżności ?. Mając daną funkcję regresji spełniającą 
powyższe warunki oraz przyjmując zasadę „status quo” (tzn. zakładając nie- 
zmienność funkcji w okresie prognozowanym) możemy przystąpić do ustalenia 
wartości zmiennej prognozowanej w okresie prognozowanym T. W tym celu do 
funkcji regresji podstawiamy wartości zmiennych objaśniających w okresie objętym 
prognozą. Czynność ta nosi nazwę ekstrapolacji funkcji regresji poza próbę, a otrzy- 
mane w jej wyniku prognozy określane są mianem prognoz złożonych (z uwagi 
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na występującą zazwyczaj większą liczbę zmiennych objaśniających). Po ustaleniu 
prognozy, można przystąpić do określenia błędu predykcji. Procedurę wyznaczania 
prognoz w oparciu o funkcję regresji zilustrujemy konkretnym przykładem. 

W celu zbadania zależności pomiędzy wysokością obrotów (Y') w sklepach pew- 
nej branży a liczbą zatrudnionych (X) i powierzchnią użytkową sklepów wyrażoną 
w dziesiątkach m?(X2) zebrano niezbędne informacje w 7 kolejnych jednostkach 
czasu (jednostkami tymi mogą być np. lata). Informacje te przedstawiają się 
następująco: 


Jednostki czasu 1 
Obroty w mid zł 2 
Zatrudnienie w osobach 3 
Powierzchnia użytkowa 5 


3 4 5 6 7 
7 9 12 15 20 
9 15 8 12 16 
3 9 17 14 16 


CORP 


1 


Jednorównaniowy model ekonometryczny o postaci liniowej funkcji regresji 
można w tym przypadku zapisać w następującej postaci ogólnej: 


Yı = ao + X + a2X2 té (9) 


gdzie Y, jest zmienną objaśnianą, Xu i Xi — zmiennymi objaśniającymi, ao, 
a1, a2 — parametrami strukturalnymi, 6, — składnikiem losowym, natomiast 
t=1,2,...,7 oznacza numer okresu (obserwacji na zmiennej). 

Przy szacowaniu funkcji (9) niezwykle wygodny jest zapis wektorowo-macie- 
rzowy. Równanie (9) w notacji wektorowo-macierzowej przyjmuje postać: 


Y=Xo+< (10) 
W postaci rozwiniętej równanie macierzowe (10) zapisujemy jako: 
yı l za © Zik LZ 4 
v2 l za © I% ai 62 
|= ; ; , ; (11) 
Yn Yn Zn2 t Fnk ak Én 


Natomiast relację, w której wartości parametrów strukturalnych a; (i = 0,1,2,..., k) 
zastąpiono ich ocenami a;, a składnik losowy ć; jego realizacjami u, (resztami) 
można zapisać w postaci: 


. 


.Y=Xa+u (12) 


gdzie: Y — wektor kolumnowy realizacji wartości zmiennej objaśnianej o wymiarach 
nzl, X — macierz realizacji wartości zmiennych objaśniających o wymiarach 
nz(k + 1), u — wektor kolumnowy reszt o wymiarach nzl. 

Podstawową metodą estymacji parametrów strukturalnych jednorównaniowego 
modelu ekonometrycznego jest klasyczna metoda najmniejszych kwadratów (KMNK). 
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Przy założeniu, że spelnione są warunki stosowalności KMNK, oceny parametrów 
strukturalnych otrzymujemy ze wzoru: 


a=(X'X)"!X'y (13) 
gdzie symbol ’ jest znakiem transpozycji. 

Przystępując do wyznaczenia wektora ocen parametrów strukturalnych a 
według wzoru (13) należy w pierwszej kolejności wyznaczyć iloczyn macierzy trans- 
ponowanej (przestawionej) X’ i macierzy X. Macierz transponowaną X” otrzymu- 
jemy z macierzy X poprzez zastąpienie wierszy kolumnami, kolumn zaś. — wier- 
szami. Wykorzystując dane liczbowe z naszego przykładu mamy: 


1 3 5 
1 6 9 
11 1 1 1 1 1 1 9 13 7 69 83 
XX=|3 6 9 15 8 12 16 1 15 9 |=| 69 815 s: | 
5 9 13 9 17 14 16 1 8 17 83 881 1097 
1 12 14 
1 16 16 


Z kolei należy wyznaczyć macierz odwrotną (X'X)7*. Warunkiem koniecznym i 
dostatecznym istnienia macierzy odwrotnej do danej macierzy kwadratowej jest, 
aby macierz ta była nieosobliwą, tzn. aby jej wyznacznik był różny od zera. W na- 
szym przypadku mamy det X'X = 78880 # 0. Macierz X'X jest zatem macierzą 
nieosobliwą. Istnieje więc macierz odwrotna do niej. W celu wyznaczenia macierzy 
odwrotnej (X'X)7! znajdujemy najpierw dopełnienia algebraiczne wszystkich ele- 
mentów macierzy X'X. W naszym przykładzie macierz dopełnień algebraicznych 
(X'X)P ma postać: 
117894 —2570 —6856 
(X'X)P = | —2570 790  —440 
—6856  —440 944 
Dzieląc elementy macierzy dopełnień algebraicznych (X’X)? przez wyznacznik 
det(X'X) otrzymujemy macierz odwrotną (X'X)"!: 
117894 —2570 —6856 | | 1,4946 —0,0326 —0,0868 | 


(X'X)"' = A —2570 790  —440 —0,0326 0,0100 —0,0056 
—6856  —440 944 —0,0869 —0,0056 0,0120 


W kolejnym etapie należy znaleźć iloczyn transponowanej macierzy X” i wektora y: 


2 

4 
11 1 1 1 1 1 7 69 
"|. Xy=|3 6 9 15 8 12 16 9 | = | 824 
5 9 13 9 17 14 16 12 952 
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Podstawiając wszystkie wyniki pośrednie do wzoru (13) otrzymujemy: 


1,4946 —0,0326 —0,0869 63 —6, 4628 
a= | —0,0326 0,0100 —0,0056 824 | = 0,6594 
—0,0869 —0,0056 0,0120 952 0,8135 


Liniowa funkcja regresji wysokości obrotów sklepów (Y) względem liczby zatrud- 
nionych (X1) i powierzchni użytkowej (X2), ma więc następującą postać: 


U = —6, 4628 + 0, 659411, + 0, 8135r2, 


Współczynnik regresji cząstkowej a; = 0,6594 oznacza, że przy stałej powierzchni 
użytkowej sklepów (X2 = constans), wzrostowi liczby zatrudnionych o jedną osobę 
odpowiada przeciętny wzrost obrotów sklepów równy 0,6594 mid zł w skali rocznej. 
Współczynnik regresji cząstkowej a} = 0,8135 oznacza, że przy stałej liczbie 
zatrudnionych (X, = constans) wzrostowi powierzchni użytkowej sklepów o każde 
10 m? odpowiada przeciętny wzrost wartości rocznych obrotów o 0,8135 mln zł. 

Dokonując statystycznej weryfikacji oszacowanego modelu, obliczymy błędy 
standardowe ocen parametrów strukturalnych a;. Oceny średnich błędów szacunku 
parametrów strukturalnych otrzymujemy w drodze pierwiastkowania elementów 
leżących na głównej przekątnej macierzy wariancji i kowariancji. Macierz wariancji 
i kowariancji powstaje przez przemnożenie wariancji składnika resztowego S?(u) 
przez macierz (X'X)"!. Oznaczając macierz wariancji i kowariancji symbolem 
D?(a) otrzymujemy: 


D?(a) = S*(u) (X'X)"' (14) 


Macierz D?(a) ma wymiary kxk (k — liczba szacowanych parametrów). Elementy 

znajdujące się na głównej przekątnej macierzy D?(a) są równe wariancjom esty- 

matorów poszczególnych parametrów, tzn. element leżący na przecięciu się i-tego 

wiersza i j-tej kolumny jest równy wariancji estymatora a; (i = 0,1,...,k). Ele- 

menty znajdujące się poza główną przekątną są równe kowariancjom estymatorów, 

tzn. są parametrami określającymi stopień skorelowania dwóch estymatorów. 
Wariancję składnika resztowego S?(u) obliczamy następująco: 


a _YY-aAKX'y 
MUSE = (15) 

Wykorzystując dane liczbowe z naszego przekładu mamy: 

2 

4 

7 

yy=[2 4 7 9 12 15 20]| 9 | =919 
12 
15 
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Róg: 
a'X'y= | —6,4628 0,6594 0,8135 ] | 824 | = 871,8644 
| 952| 
Stąd: 
S?(u) = 219— 8711864 _ 14 7839 


1-3 


Macierz wariancji i kowariancji jest zatem równa: 


1,4946 —0,0326 —0,0869 17,6122 —0,3842 —1,0240 
D?(a) = 11,7839 | —0,0326 0,0100 —0,0056 | = | —0,3842 0,1178 —0,0660 

—0,0869 —0,0056 0,0120 —1,0240 —0,0660 0,1414 | 
Średnie błędy szacunku parametrów strukturalnych oszacowanej funkcji regresji 
obliczymy następująco: 


D(a,) = V1T,6122 = 4, 1967 
D(a,) = /0, 1178 = 0, 3432 


D(a2) = 4/0, 1414 = 0,3760 


Oszacowaną w naszym przykładzie funkcję regresjo można więc ostatecznie zapisać 
w postaci: 


jk = -6,4628 + (0,6594z, +  0,81352;> 
(4,1967) (0,3432) (0,3760) 


gdzie pod ocenami parametrów strukturalnych zapisane są w nawiasach ich średnie 
błędy szacunku. 

Zbadamy teraz istotność statystyczną otrzymanych ocen. Hipotezę zerową 
zapiszemy w postaci: Ho : a; = 0, a hipotezę alternatywną jako: Hy : a; £ 0. 
Statystyki t-Studenta obliczymy ze wzoru: 


ai 
t= D(a;) (16) 


Podstawiając odpowiednie dane z naszego przykładu do wzoru (16) mamy: 


—6, 4628 


ig67 = 154 


t(ao) = 
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0,6594 


t(a,) = 0,3432 = 1,9213 
0,8135 _ 
t(a2) = 0,3760 = 2, 1636 


Przyjmując poziom istotności a = 0, 1 odczytujemy z tablic rozkładu Studenta — 
dla 4 stopni swobody — wartość krytyczną ła = 1, 132. We wszystkich przypadkach 
zachodzi |t| > ta. Oznacza to, że zmienne objaśniające x; i 12 wywierają istotny 
wpływ na kształtowanie się zmiennej objaśnianej Y. 

Z kolei sprawdzimy, czy oszacowana funkcja regresji jest dobrze dopasowana do 
danych empirycznych. W tym celu obliczymy współczynnik zbieżności 2” wedlug 


wzoru: 
2_ yy PPA a' X'y 
yy iy) 
gdzie 1’ jest transponowanym wektorem jedynek. 


Podstawiając odpowiednie dane liczbowe z naszego przykładu do wzoru (17) 
otrzymujemy: 


p (17) 


2 _ 919 — 817,8644 


= pioa parer 7 7% 


Oszacowaną funkcję regresji należy więc ocenić jako dość dobrze dopasowaną do 
danych empirycznych, gdyż jedynie 19,73% całkowitej zaobserwowanej zmienności 
(wariancji) zmiennej Y jest dziełem przypadku. Pozostała część (80,27%) calkowitej 
zaobserwowanej zmienności zmiennej Y jest wyjaśniona zmiennością przyjętych 
zmiennych objaśniających zy i 1ą. Ostatecznie możemy więc stwierdzić, że oszaco- 
wana funkcja regresji dobrze opisuje kształtowanie się wielkości obrotów i może być 
wykorzystana dla celów prognozowania. 

Tak więc do prognozowania poziomu obrotów w sklepach tej branży w okresach 
np. n+ 1 oraz n + 2 zostanie wykorzystany predyktor o postaci: 


yr = —6, 4628 + 0, 6594zx qr + 0, 8135z2qr 


Zakładając, że wartości zmiennych objaśniających (zatrudnienie i powierzchnia 
użytkowa) w okresie n + 1 wyniosą odpowiednio: 18 i 22, natomiast w okresie 
n +2 — 20 i 24, prognozy obrotów wyznaczymy następująco: dla okresu n + 1: 
Yr = —6, 4628 + 0,6594 - 18 + 0,8135 - 22 = 23,3034 mld zł, dla okresu n +2 : 
Yr = —6, 4628 + 0, 6594 - 20 + 0, 8135 -24 = 26, 2492 mld zł. Średnie bledy predykcji 
obliczamy ze wzoru: 


k-1 
Vr = xg D?(a;) +2), È Xir X,roov(ai, a, )+oż | (18) 


izil i=l a>i 
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gdzie: X;r, X,r — założone wartości zmiennych objaśniających w okresie prognozo- 
wanym, D?(a;) — wariancja estymatora a;, cov(a;, as) — kowariancja estymatorów 
parametrów a;, a,, oż — wariancja składnika losowego w okresie prognozowanym 
(praktycznie przyjmuje się, że aż. = S*(u)). 

Wstawiając odpowiednie dane z naszego przykładu do wzoru (18) mamy: 


— dla okresu n + 1: 
VÝ = 1° -17,6122 + 18? -0, 1178 + 22? -0,1414+ 2 [1. 18 - (—0, 3842)+ 
+1 - 22 . (—1, 0240) + 18 - 22: (—0,660)] + 11,7839 = 
= 124,217 — 111, 1592 + 11,7839 = 24, 8417 
Stąd Vr = V24, 8417 = 4,98 


— dla okresu n + 2: 
Vf = 1 . 17,6122 + 20? - 0, 1178 + 24? - 0, 1414 + 2 [1. 20 - (—0, 3842)+ 


+1 - 24 . (—1, 0240) + 20 - 24 . (—0,660)] + 11, 7839 = 
= 146, 1786 — 127,88 + 11, 7839 = 30,0825 
Stąd Vr = %/30,0825 = 5, 48. 
Dla modelu jednorównaniowego wariancję predykcji można również obliczyć 
stosując wzór macierzowy o postaci: 


= X, D?(a;)X. + oj (19) 


gdzie X, jest wektorem założonych wartości zmiennych objaśniających w okresie 
prognozowanym. 

Podstawiając odpowiednie dane liczbowe z naszego przykładu do wzoru (19) 
otrzymujemy: . 


— dla okresu n + 1: z 


17,6122 —0,33842 —1,0240 1 
Vr=[1 18 22]| —0,3842 0,1178 —0,0660 8 | +11,7839= 
2 


1 
—1,0240  —0,0660 0,1414 2 


= [ -11,8314 0,2842 0,8988 | 18 + 11, 7839 = 24, 8417 
22 
— dla okresu n + 2: 


> 17,6122 —0,3842 —1,0240 1 
VWr=[1 20 24] | —0,3842 0,1178 —0,0660 20 | +11,7839 = 
—1,0240 —0,0660 0,1414 24 
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1 
= Í —14,6478 0,3878 1,0496 | | 20 | + 11,7839 = 30,0825 
24 


Otrzymane wyniki są identyczne z tymi, które uzyskano przy zastosowaniu wzoru 
(18). Obydwa sposoby można więc stosować zamiennie. Stosowanie wzoru macie- 
rzowego (19) jest jednak mniej czasochłonne. 

Względne błędy średnie predykcji (wzór 5) są natomiast równe: 
— dla okresu n + 1: Vr = za 100 = 21,37% 


— dla okresu n + 2: Vr = Ery -n -100 = 20,88% 

Przy prognozowaniu techniką przedziałową konieczne jest dodatkowe założenie o 
normalności rozkładu składników losowych 6, modelu (9). Przy tym dodatkowym 
założeniu wzór na przedział ufności dla przyszłej wartości yr zmiennej objaśnianej 
Y ma postać:* 


Pfyrp —taVr <Yr<yrp+taVr)=l=a (20) 


gdzie ypp oznacza prognozę punktową, Vr jest średnim błędem predykcji, I — a 
określonym z góry współczynnikiem ufności, tą — wartością zmiennej t-Studenta 
odczytaną z tablicy tego rozkładu dla poziomu istotności a i dla n — k — 1 stopni 
swobody w taki sposób, aby spełniona była relacja: P{ļt| > ta} = a. 

Dla 1—a = 0,95 oraz 7—2—1 = 4 stopni swobody wartość ta = 2, 176. Prognozę 
przedziałową wysokości obrotów zbudujemy zatem w następujący sposób: 
— dla okresu n + 1: 


23, 3034 — 2, 776 - 4,98 < Yn+ı < 23, 3034 + 2, 776 : 4,98 


9,4789 mld zł < Yy+1 < 37, 1279 mid zł 
— dla okresu n + 2: 


26, 2492 — 2, 776 - 5,48 < Yn+2 < 26, 2492 + 2, 776 - 5,48 


11,0367 mld zł < Yn42 < 41, 4617 mld zł 


Dlugość przedziału prognozy (czyli różnica między górną i dolną granicą przedziału) 
zależy przede wszystkim od wielkości średniego błędu predykcji. Im błąd ten jest 
większy, tym przedział dłuższy, a prognoza mniej dokładna. Ponadto, długość prze- 
działu prognozy nie jest wielkością stałą, gdyż średni błąd predykcji występujący 
we wzorze (20) jest funkcją założonych na okres prognozowany wartości zmiennych 
objaśniających. 


6 Praca zbiorowa pod red. W. Sadowskiego: Elementy ekonometrii i programowania 
matematycznego, PWN, Warszawa 1985, s. 58. 
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EKSTRAPOLACJA TENDENCJI ROZWOJOWEJ 


Wykorzystanie modeli tendencji rozwojowej dla celów prognozowania eliminuje 
problem ustalania wartości zmiennych objaśniających w okresie prognozowanym, 
gdyż jedyną zmienną objaśniającą jest tu czas. Prognozowanie w oparciu o predyk- 
tor trendu może być stosowane jedynie w tym przypadku, gdy nie ma wyraźnych 
okoliczności przemawiających przeciw zasadzie dynamicznego „status quo”. Zasada 
ta głosi, że postać analityczna funkcji trendu i wartości jej parametrów w okresie 
prognozowanym T nie mogą ulec istotnej zmianie w porównaniu z okresem, którego 
dotyczyły informacje liczbowe służące za podstawę szacowania modelu trendu. W 
przeciwnym przypadku metoda ekstrapolacji funkcji trendu jest zawodna i prowadzi 
— na ogół — do dużych błędów wnioskowania w przyszłość. 

Technikę budowy prognozy w oparciu o funkcję tendencji rozwojowej ziłustru- 
jemy przykładem dotyczącym zużycia energii elektrycznej w pewnej gałęzi prze- 
mysłu. Dysponujemy następującymi danymi wyjściowymi: 


Jednostki czasu 1 2 3 4 5 6 7 8 9 10 


Zużycie energii 116 117 122 115 118 126 135 138 140 146 
(w mln kWh) 


Opierając się na graficznej ocenie przebiegu szeregu czasowego wielkości zużycia 
energii elektrycznej, za analityczną postać badanej zmiennej przyjęto liniową 
funkcję trendu o postaci: 


Yı = ao + at +6; (t = 1,2,...,n) (21) 


Parametry ao i a, funkcji (21) oszacowano metodą najmniejszych kwadratów. 
Stosowanie MNK do szacowania parametrów funkcji (21) sprowadza się do 
rozwiązania układu równań normalnych o postaci macierzowej: 


T'y = T'Ta (22) 
gdzie: 
yı 11 
Y2 1 2 Ado 
ie. |ese) |asl>| 
Yn ln 


Przekształcając relację (22) otrzymujemy: 


a = (T'TY T'y (23) 


Określając macierz odwrotną wzorem: 
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Gael 7] (24) 


gdzie a, i ay otrzymujemy z równania: 


A C L w A E u - C } tu 
a= | z | t=1 = t=1l tzl (25) 
-C B n si ; u 
L tyu -C E u + B Ọ tw 
t=1 t=l t=l 
Stąd 
n n 
ão = AY y -C9 tu 
t=1 t=l 
n n 
a1=-C))u+BY_tu - (26) 
t21 t=1 
Wykorzystując z kolei równości: 
TA n(n + 1) (27) 
2 
t=1 
oraz 
e 5 n(n + AC + 1) (28) 
t=1 


otrzymujemy następujące wzory na wartości A, B,C (uzależnione tylko od n)”: 


r 2(2n + 1) 
= man 1)Z3n(n FD) (29) 
12 
B= aat Dnt na F Y (30) 
F Í (31) 


z Z2n(2n + 1) — Jn(n + 1) 


Wariancję składnika resztowego funkcji (21) obliczamy według wzoru (15). Pier- 
wiastkując wartość wariancji otrzymujemy odchylenie standardowe składnika resz- 
towego S(u). Średnie błędy szacunku znajdujemy natomiast ze wzorów: 


D(a,) = S(u)VA (32) 


T T. Grabiński, S. Wydymus: Uproszczone procedury estymacji modeli tendencji roz- 
wojowej i wykorzystania ich do predykcji, AE, Kraków 1982, s. 16. 
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oraz 


D(a) = S(u)vVB (33) 


W przypadku wykorzystywania oszacowanej funkcji (36) do prognozowania, należy 
obliczyć średni błąd predykcji ez ante. W przypadku liniowej funkcji trendu wzór 
na średni błąd predykcji ma postać: 


Vr = y D?(a,) + D?(a1) + 2cov(ao,a1)T + 03. (34) 


gdzie o2 = S?(u). Wiedząc, że cov(a,,a;) = S?(u)VČ oraz dokonując dość 
skomplikowanych przekształceń wzoru (34) otrzymujemy następujący wzór na 
średni błąd predykcji w przypadku liniowej funkcji trendu: 


3(3T — n- 1)? 
nn 


Vr = S(u)4/1+n-1+ (35) 
Wykorzystując dane liczbowe z naszego przykładu — przy n= 10 — mamy: 


2(2-10+ 1) 


A= 0670 F1)=3-10do ij = 04667 
B 12 ] 


= 10007 D210+D=3- og 7 21: 
6 


= 2102 10F1)Z3-10004 1) 7 557 


C 


n n 
VA = 0,6832, VB = 0,11, VC = 0,2583, $ y: = 1273, Y` ty = 7291. 
t=1 


Wykorzystując układ (26) otrzymujemy: 
a, = 0,4667 - 1273 — 0, 0667 : 7291 = 107, 7994 
a; = —0, 0667 : 1273 + 0,0121 -7291 = 3,312 


Odchylenie standardowe składnika resztowego obliczone na podstawie danych licz- 
bowych z naszego przykładu wynosi S(u) = 4,8731. Średnie błędy szacunku poli- 
czone przy wykorzystaniu wzorów (32) i (33) są zatem równe: 


D(a,) = 4,8731 - 0,6832 = 3,3293 
e D(aı) = 4,8732 -0,11 = 0,536. 


Oszacowana liniowa funkcja trendu zużycia energii elektrycznej przyjmuje więc 
postać: 
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$+ = 107,7994+ 3,3121 + u, 
(3,3293) (0,536) (4,8731) (36) 


gdzie w nawiasach pod ocenami parametrów strukturalnych podane są średnie błędy 
ich szacunku. 

W kolejnym etapie dokonamy statystycznej weryfikacji istotności otrzymanych 
ocen. Stawiamy hipotezę zerową: H, : a; = 0, wobec hipotezy alternatywnej (kon- 
kurencyjnej): Hı : a; # 0. Test istotności pozwalający na weryfikację postawionej 
hipotezy zerowej oparty jest na rozkładzie statystyki t-Studenta (wzór 16). W na- 
szym przykładzie mamy: 


107, 7994 


t(a.) = -3,3293 = 32,379 
oraz 
3,312 j 
7 t(a) = 0,536 = 6, 179 


Wartość krytyczna statystyki ł odczytana z tablic rozkładu Studenta dla poziomu 
istotności a = 0,05 i dla 10 — 2 = 8 stopni swobody wynosi: łą = 2,306. Dla 
obydwu parametrów spełniona jest więc nierówność: |t| > łą. Stąd też hipotezę 
zerową należy odrzucić na korzyść hipotezy alternatywnej. O dobrym opisie przez 
oszacowaną funkcję trendu (36) zużycia energii elektrycznej świadczy również mała 
wartość współczynnika zbieżności (9? = 0, 16). 

Ekstrapołacja wyznaczonej funkcji trendu na okres przyszły wymaga wyraźnego 
sformułowania zalożenia, że czynniki kształtujące poziom zużycia energii elek- 
trycznej nie ulegną istotnej zmianie w okresie objętym prognozą. Przyjmując to 
założenie, dla zbudowania prognozy zużycia energii korzystać będziemy z predyk- 
tora o postaci: 


Yr = 107, 7994 + 3,3127 (37) 


Z uwagi na to, że okres n+ I ma numer 11 (10+1), prognoza zużycia energii w tym 
okresie będzie równa: 


Yrp = 107,7994 + 3,312- 11 = 144, 2314mln kWh 
Wykorzystując z kolei wzór (35) obliczymy średni błąd predykcji: 


í = = 1) 
Vr = 4,8731 licy 81-10-17? 


6 105710 = 7,1472 


Względny średni błąd predykcji (wzór 5) jest natomiast równy: 
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> 7,1472 


Dokładność zbudowanej prognozy należy więc uznać za zadowalającą. 

Dla a = 0, 05 i 8 stopni swobody wartość krytyczna statystyki t Studenta wynosi 
ta = 2,306. Prognozę przedziałową zużycia energii ełektrycznej wyznaczymy zatem 
następująco: 


144, 2314 — 2,306 - 7, 1472 < Yr < 144,2314 + 2,306 - 7, 1472 
127, 75 mln kWh < Yr < 160,71mln kWh 


Z prawdopodobieństwem 0,95 można zatem twierdzić, że zużycie energii elektrycz- 
nej przez rozpatrywaną gałąź przemysłu w okresie n + 1 będzie wielkością z prze- 
działu (127,75-160,71 mln kWh). 


SUMMARY 


The articie makes use of two most frequent methods in the process of prediction. These are 
the functions of regression and trend (progressive tendency). Both procedures of prediction are 
included within the group of statisticał — mathematic methods. Besides a purely theoretical 
discussion, the article presents definite numerical examples, which make it easier to understand 
the substance of the methods discussed here and their possibilities of practical application. 


